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开放 数据 的 集成 应 用 研究 


顾 立 平 
(中 国 科学 院 国家 科学 图 书馆 北京 100190) 


【摘要 】 在 系统 性 梳理 开放 数据 案例 的 基础 上 ,说 明 开 放 数 据 发 展 中 面临 的 科技 信息 政策 问题 ,提出 图 书馆 学 的 
信息 组 织 原 则 和 方法 是 面 对 未 来 开放 数据 管理 的 一 项 重要 预科 学 基础 。 
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[Abstract] Based on the systematically reviewed cases of the open data, the paper describes the science and technology 

«policy issues as the bottlenecks of the open data development, and indicates that the principle and method of the informa- 
tion organization of the library science as an important basic of the pre — science for the open data management in future. 
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L 科技 创新 与 知识 社会 的 发 展 趋势 


) ” 越 来 越 多 人 认为 社会 的 模型 正在 被 改变 ,从 工业 模型 到 知识 模型 ,而 知识 模型 最 主要 的 改变 在 于 原料 质变 ， 
也 就 是 数据 和 信息 交流 方式 的 改变 ，”。 近 年 来 随 着 开放 获取 运动 (Open Access, OA ) 和 开放 档案 倡议 ( Open 
Archives Initiative, OAT) 的 提出 和 推进 ,在 信息 管理 领域 中 ,开放 数据 (Open Data, OD ) 和 关联 开放 数据 (Linked 
Open Data, LOD) 成 为 重要 举措 ” 。 例 如 ,过 去 地 理 勘 探 和 地 理 研究 必须 单独 依靠 文献 阅读 和 专项 研究 计划 收集 
部 分 有 限 的 数据 ,现在 通过 使 用 OAT 以 及 LOD 原则 和 标准 建立 的 地 理 空间 网 络 应 用 程序 ,能 解决 许多 应 用 学 科 
快速 发 现 地理 信 息 资源 的 需求 ,通过 复合 异 构 网 络 资源 进行 灵活 的 数据 集成 ” 。 其 对 于 科学 研究 社会 管理 乃至 
国防 边界 测量 都 发 挥 了 巨大 作用 。 

化 学 界 的 蓝 方 尖塔 (Blue Obelisk) 运动 目的 是 促进 化 学 软件 之 间 的 互 操 作 性 、 避 励 开放 源码 开发 人 员 之 间 的 
合作 ,发 展 化 学 研究 社 群 的 资源 和 开放 标准 。 科 研 人 员 特 别 是 善于 从 化 学 信息 计量 中 寻找 问题 解决 方案 的 科 
WAR ,观察 到 化 学 原料 之 外 的 “化 学 类 信息 原料 "对 于 学 科 发 展 具有 重要 影响 。 尽 管 开放 标准 和 开源 软件 还 存 
在 许多 挑战 ,但 是 蓝 方 尖 塔 运 动 已 经 为 化 学 科研 人 员 汇 聚 了 许多 免费 使 用 的 有 用 资源 。 因 此 ,认识 并 且 准 备 开放 
数据 的 应 用 与 集成 ,是 一 项 已 经 发 生 并 且 仍 在 发 展 的 关键 信息 组 织 议题 ,这 不 是 地 理 、 化 学 或 者 其 他 专门 学 科 的 
特殊 现象 ,而 是 全 体 知识 经 济 社会 发 展 的 一 项 主要 动力 。 
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数字 图 书馆 


从 科技 创新 与 知识 社会 的 发 展 趋势 来 看 ,开放 数 
据 的 应 用 将 成 为 一 项 推动 社会 变革 的 原料 。 研究 开放 
数据 有 助 于 图 书 情报 机 构 掌 握 此 类 技术 ,并 且 理 解 科 
技 创 新 和 国际 社会 的 变化 脉动 ,提早 准备 相应 的 服务 
文 援 工 作 。 


2 科研 需求 所 产生 的 科研 工具 


开放 数据 有 两 个 层面 :上 层 的 数据 格式 ,例如 从 一 
个 专 有 格式 转化 成 资源 描述 框架 (Resource Description 
Framework ，RDF) 数 据 ; 底 层 的 本 体 学 习 的 关系 模式 ， 
即 如 何 有 效应 用 语义 网 [Semantic Web, SW ) 与 关联 数 


qi ( Linked Data, LD)”。 目 前 多 数 采用 释 出 第 一 层 开 
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用 相对 封闭 的 管理 模式 ,以 确保 数据 
j 效 果 。 各 个 机 构 或 者 网 站 根据 实际 需求 ， 
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O21 全 球 暖 化 的 海 冰 监 测 需 求 


地 球 或 者 陆地 消失 ,人 类 将 不 复 存 在 。 在 全 球 环 


> 禾 与 空间 安全 监测 计划 中 , 欧洲 航天 局 ( European 


“Space Agency, ESA) 的 欧洲 雷达 观测 站 ,在 两 个 极地 轨 


不 同 的 开放 数据 档案 中 ,更 容易 地 寻找 相关 的 危险 性 
着 息 ” 。 由 于 过 去 数据 的 零散 收集 ,使 得 参数 估计 检 
验 的 取材 有 限 , 然 而 预测 科学 主要 的 逻辑 是 所 有 证 据 
指向 同一 个 方向 ,而 且 证 据 链 越 多 越 好 (预测 更 加 准确 
快速 )。 因 此 , 拉 开 预测 时 间 和 发 生 时 间 的 差距 则 依赖 
更 多 有 效 数据 的 完整 集成 ,目前 ,开放 数据 能 够 打破 各 
种 隔 闵 ,是 取得 这 种 数据 的 最 佳 途 径 。 
2.3 ”全球 物 种 观察 和 药物 开发 

人 类 对 抗 疾病 有 数 千 年 历史 ,目前 病毒 已 经 全 球 
流行 并 且 交 互 繁殖 ,而 人 们 却 尚 未 建立 好 共同 合作 研 
究 的 机 制 , 所 幸 有 ChEMBL 这 种 开放 的 数据 资料 库 为 
先驱 者 。 它 包含 类 似 药物 的 生物 活性 化 合 物 的 大 量 信 
息 , 这 些 数据 来 自 定期 公布 的 主要 文献 ,然后 予以 标准 
化 ,最 大 限度 地 提高 数据 质量 ,使 化 学 生物 学 和 药物 发 
现 得 到 广泛 应 用 "1 。 根 据 IMEX 联盟 (The International 
Molecular Exchange Consortium) 订立 的 分 子 数据 交换 原 
MJE EBI 是 一 个 建立 分 子 相互 作用 的 开源 数据 库 ,到 
2011 年 9 月 为 止 ,已 经 吉 括 了 大 约 275 万 条 来 自 5 000 
余 种 出 版 物 上 的 数据 , 它 的 开放 数据 来 自 文献 数据 或 
者 直接 数据 。 通 过 访问 这 个 网 站 '” ,可 以 取得 完整 的 源 
代码 与 开放 数据 ,其 重要 意义 不 仅 是 生物 医学 领域 的 开 
放 数 据 机 制 ,还 是 开放 科学 中 的 合作 共享 典范 。 
2.4 ”跨越 文献 流通 限制 建立 蛋白 结构 数据 集成 

开放 数据 库 中 ,基因 表达 数据 的 数量 不 断 增 长 , 跨 


‘= 省 卫星 延续 和 改进 的 发 展 报告 书 中 ,规划 了 如 何 进行 


“CRD ,分 发 和 归档 等 改革 制度 ,其 中 发 展 政策 包括 


提供 开放 数据 以 服务 海洋 监测 、 海 冰 监 测 和 检测 下 沉 
和 山体 滑坡 等 紧急 反馈 措施 “ 。 全 球 各 地 的 科学 家 、 
信息 分 析 师 甚至 只 是 业余 爱好 地 质 观测 的 网 民 , 可 以 
在 这 个 平台 上 收集 数据 、 建 立 模型 .进行 预测 。 开 放 数 
据 并 不 为 科研 项 目 和 经 费 支 持 的 团队 独 享 的 意义 是 : 
任何 人 都 能 检验 科研 成 果 和 运用 科研 成 果 , 从 而 加 大 
科研 群体 的 公信 力 和 影响 力 。 哪 怕 只 是 非 专 业 人 士 所 
提供 的 实验 数据 和 结果 ,也 可 以 在 开放 社 群 中 经 过 科 
学 验证 无 误 后 做 出 贡献 。 
2.2 全 球 板块 推移 的 地 震 预测 

在 一 个 正常 的 断层 地 震 序列 记录 过 程 中 ,有 可 能 
快速 收集 引发 破坏 性 地 震 的 数据 ,并 且 快 速 反应 地 震 
应 急 情 报 。 欧 洲 正在 建立 不 同 网 络 之 间 通 信 平 台 的 共 
同 网 络 运营 战略 ,使 地 震 构造 和 地 震 物理 研究 人 员 在 
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越 不 同 的 数据 集 ,大 规模 收集 这 些 基因 表达 的 相似 之 
处 ,产生 新 的 关系 ,可 能 有 助 于 观察 特定 模式 的 原因 和 
后 果 的 假设 建立 ”。 根 据 这 个 逻辑 ,生物 医学 研究 目 
前 正在 积极 地 从 事 开放 数据 运动 。 例 如 剑桥 大 学 的 
CrystalEye 项 目 , 从 网 络 资源 中 自动 生成 关于 晶体 结 
构 数 据 的 结构 化 XML 的 开放 数据 ,提供 浏览 .搜索 和 
新 知 快报 。 可 以 说 ,在 开放 科学 中 ,专家 的 定义 不 
在 于 拥有 多 少 头 衔 掌握 多 少 别人 没有 的 资源 ,而 在 
于 使 用 少量 资源 (或 者 日 益 增 长 的 开放 数据 ) 做 出 
2.5 ”跨越 语种 限制 建立 大 规模 中 文 维基 资源 

语义 网 的 目标 是 建立 “数据 网 络 " 使 得 机 器 了 解 
网 络 上 的 信息 ;关联 开放 数据 (LOD ) 项 目 鼓 励 个 人 和 
组 织 在 网 络 上 发 布 各 种 公开 的 数据 集 ,再 通过 资源 描 
述 框架 (RDF ) 促进 语义 网 的 快速 发 展 。 然 而 ,根据 字 
母 拼 音 系统 设计 的 DBpedia 并 未 考虑 到 中 文 这 种 非 西 


方 的 语言 结构 ,从 而 阻碍 了 跨 语 言 资源 的 知识 共享 。 
浙江 大 学 的 团队 为 了 解决 这 个 问题 ,建立 了 一 个 基于 
Wiki 类 别 和 InfoBoxes 系统 的 本 体 模型 ,然后 从 维基 的 
文章 中 提取 实例 ,接着 提取 和 描述 DBpedia 的 概念 和 
属性 ,以 RDF 转 储 和 SPARQL 端点 访问 中 国 既 有 的 知 
识 基地 59 ,以 期 在 DBpedia 的 LOD 数据 集 ( 结构 化 知 
识 的 重要 基础 ) 中 建设 大 规模 的 中 文 维基 资源 。 

2.6 全球 人 类 基因 数据 集 集 成 和 应 用 

随 着 基因 组 测序 项 目的 快速 增长 ,需要 一 套 支持 

开放 数据 访问 和 协同 工作 的 可 视 化 系统 和 互动 平台 ， 
地 别 是 具有 丰富 功能 和 灵活 配置 框架 的 可 定制 的 基因 
T 组 浏览 器 ” 。 北 京 大 学 生物 信息 中 心 开 发 的 ABrowse 
< 征 一 个 提供 交互 式 浏览 体验 的 基因 组 浏览 器 ,可 以 进 
步 进行 数据 分 析 , 以 多 个 数据 访问 方法 支持 外 部 平 
Pp ,并 且 终端 用 户 可 以 创建 用 户 空间 ,对 资源 进行 存 
CE 分 享 评论 .注释 和 标注 !9 。 数 据 被 存档 和 收集 起 
(位 并 且 在 适当 时 机 发 布 是 开放 科学 的 重要 举措 ,北京 
CS 学 的 这 项 开放 数据 实践 ,不 仅 提供 了 一 个 方便 导入 
注释 数据 集 的 实用 程序 ,而 且 所 有 源 代码 和 技术 文档 
CC 部 对 外 开放 , 供 其 他 从 事 开放 数据 管理 的 团队 参考 。 
“27 全 球 医疗 病例 与 特殊 疾病 治疗 开发 
> 心脏 解剖 和 生理 学 的 数学 和 统计 模型 在 了 解 心 脏 
> 条 病 和 治疗 策略 中 发 挥 了 至 关 重 要 的 作用 ,而 这 类 模 


,型 的 准确 性 和 预测 能 力 ,依赖 于 非 侵入 性 成 像 数据 集 
的 广 度 和 深度 "1 。 在 医学 领域 中 ,已 建立 了 心脏 影像 
“和 栓 碍 和 相关 的 临床 数据 的 大 型 数据 库 ( Atlases ) 提供 网 
络 访问 和 开放 数据 共享 ,同时 提供 可 视 化 参数 描述 ,其 
所 有 软件 开发 的 组 件 都 是 开源 软件 ,根据 Mozilla 公共 
许可 协议 版 本 1. 1 免费 提供 ” 。 任 何 科学 结论 都 需 
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现 ,在 海洋 地质 .生物 药品、 医疗 等 诸多 领域 目前 已 
经 有 许多 开放 数据 的 应 用 工具 值得 关注 和 参考 。 然 
而 ,有 别 于 理工 农 医 ,在 社会 科学 中 ,特别 是 网 络 参与 、 
政府 治理 和 地 理 疆 界 等 领域 ,也 开始 产生 公众 所 需 的 
社会 工具 ,但 这 些 社会 工具 尚未 被 充分 开发 。 
3.1 全 球 网 络 终端 用 户 的 知识 服务 需求 

人 们 希望 根据 自己 的 兴趣 填补 有 限 的 宝贵 时 间 ， 
与 此 同时 ,文化 传播 机 构 也 正 努 力 吸 引 人 们 参与 他 们 
精心 策划 的 文化 活动 ,为 此 开发 一 个 链接 开放 数据 的 
RDF/OWL 表示 框架 可 以 针对 性 地 发 送 聚 合 事件 , 汇 
总 、 充 实 、 提 议 这 些 事件 。 目 前 ,从 注册 的 所 有 用 户 群 
体 中 自动 构造 聚集 全 球 用 户 配置 文件 (Profile - 型 人 ) 
以 推荐 用 户 适当 的 事件 信息 ,可 以 通过 开放 数据 提供 
一 个 开放 的 、 用 户 友 好 的 系统 平台 |。 这 是 因为 开放 
数据 能 够 丰富 用 户 兴 趣 ( End - User Interest) 的 条 目 ， 
社 群 系统 根据 这 些 事件 的 项 目 分 类 ,并 通过 智能 索引 
以 及 网 络 上 提供 的 链接 开放 数据 集 ,增加 用 户 可 选 性 
或 者 信息 推荐 的 准确 度 。 
3.2 ”政府 治理 技巧 的 开放 数据 需求 

与 科技 创新 的 开放 数据 需求 不 同 ,科技 创新 主要 
考虑 开放 数据 的 预期 受 惠 效果 。 而 政府 治理 技巧 的 开 
放 数 据 需 求 , 则 在 于 信息 披露 越 多 ,承担 政治 责任 的 压 
力 (政务 官 ) 越 少 ,行政 管理 工作 (事务 官 ) 的 负责 项 目 
越 少 。 欧 洲 议 会 和 欧盟 理事 会 的 2003/98/EC 启动 的 
政府 开放 数据 运动 ,是 根据 W3C(World Wide Web 
Consortium ) 的 数据 描述 建议 提供 政府 数据 的 访问 方 
法 ,这 个 项 目 包 括 开放 数据 的 结构 与 格式 、 可 以 被 重用 
的 数据 以 及 提供 给 公民 和 企业 的 新 服务 2 等。 目前， 
欧洲 当局 正在 推动 支撑 数字 经 济 和 民主 透明 度 的 公共 


要 经 过 检验 ,运用 这 些 结论 从 事 诸如 治疗 等 实践 工作 
时 ,检验 过 程 更 为 严格 。 基 于 这 个 逻辑 ,开放 数据 能 够 
让 同行 快速 取得 相同 的 数据 资料 ,从 而 加 快 检验 过 程 
和 扩大 可 检验 科学 结果 的 专业 人 群 。 如 果 数 据 掌握 在 
少数 人 手 里 而 非 开 放 数 据 , 则 这 种 科学 检验 的 过 程 势 
必 耗 时 费力 ,并 且 这 些 少 数 人 还 必须 承担 所 有 科学 结 
论 转 化 为 实践 应 用 的 道德 风险 ,基于 此 ,开放 数据 会 越 


3 ”公众 需求 所 产生 的 社会 工具 
在 科技 创新 的 需求 下 ,许多 开放 数据 工具 纷纷 出 


言 息 重用 政策 ,例如 西班牙 的 Aporta 项 目 在 公共 管理 
部 和 工商 贸易 部 的 支持 下 ,起 草 了 "公共 信息 再 利用 
法 ”” 。 这 是 因为 公共 部 门 信息 的 再 利用 是 公开 数据 
和 开放 政府 中 日 益 重 要 的 组 成 成 分 。 然 而 ,与 科技 信 
息 政 策 不 同 ,公共 信息 政策 的 规划 、 制 定 、 决 策 支 撑 工 
作 等 ,需要 首先 考虑 到 公共 行政 及 其 他 利益 相关 者 是 
否 达 成 一 致 理解 ,特别 是 对 于 开放 数据 的 收集 以 及 存 
储 格式 \ 发 布 数据 方式 等 ,这 涉及 到 语义 工具 的 管理 方 
法 和 业务 工作 的 使 用 目的 ”。 然 而 一 般 教育 体系 毕 
业 或 者 公共 部 门 训练 出 来 的 主管 并 不 具备 行政 经 验 、 
公共 关系 、 信 息 技术 和 多 种 外 语 等 多 重 能 力 ,因此 相关 
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的 开放 数据 尚未 被 充分 开发 。 
3.3 ”地理 勘探 界 的 开放 数据 战略 
2010 年 4 月 1 日 ,英国 地 形 测量 局 推出 OS Open 
Data 在 线 地 图 门户 网 站 ,允许 用 户 浏览 下载 或 者 开发 
简单 的 数据 应 用 ,人 们 可 以 访问 英国 的 地 理 信息 (Geo- 
graphic Information, GT) 并 且 提 供 相 关 应 用 ,以 促进 政 
府 透 明度 和 鼓励 更 多 地 理 信息 数据 注入 ”。 更 重要 
的 是 , 它 强 化 英国 对 某 些 特殊 的 地 理 位 置 (特别 是 边缘 
岛屿 与 海 权 领 地 等 ) 的 信息 管 治 , 使 得 国内 外 更 加 容易 
发 现 和 访问 ” 。 关 于 英国 地 形 测 量 局 面向 “公众 ”的 
地 理 标识 和 开放 数据 服务 ,值得 进一步 观察 其 他 方面 
二 和 各 国 反 应 。 


64 开放 数据 所 面临 的 政策 问题 


在 “最 大 程度 地 利用 数据 "和 “最 大 程度 地 保护 安 
CE 全 隐私 "之 间 , 一 个 具体 的 挑 成 是 发 展 电子 信息 创建 和 
C( 镶 理 的 创新 和 将 代 方 法 。 开 放 数据 集 有 许多 好 处 ， 
CC 然而 隐私 问题 阻碍 了 建立 开放 健康 数据 。 在 美国 ,为 
> 形 保 公众 使 用 的 健康 数据 的 安全 机 制 ,开放 数据 必须 
CC 符合 美国 健康 保险 流通 与 责任 法 案 ( Health Insurance 
Portapility and Accountability Act, HIPAA) 的 隐私 规则 
3 甸 要 求 ,开放 数据 的 管理 技术 必须 采用 模拟 攻击 和 匹 
> 和 配 试验 的 风险 识别 ,经 过 鉴定 能 够 实现 开放 数据 的 建 
0 立 原则 中 后 才能 实现 。 与 科技 创新 息息相关 的 开放 
沸 | 学 及 开放 数据 管理 ,其 技术 手段 和 科技 信息 政策 紧 
TERA HERJE 

生物 信息 学 领域 的 科研 人 员 一 直 在 推动 开源 软件 
和 开放 数据 的 发 展 ,但 是 ,隐私 问题 特别 是 个 人 基因 组 
数据 等 ,形成 对 重要 数据 集 的 访问 限制 ,尤其 凸显 在 基 
因 组 测序 数据 的 大 规模 共享 数据 上 。 首 先是 基因 组 测 
序 对 象 的 基本 辨识 ,即使 有 非常 详细 的 个 人 特征 ,也 有 
可 能 出 现 未 预料 到 的 基因 型 ,在 患者 同意 的 时 间 之 后 ， 
有 可 能 释放 更 多 个 人 医疗 记录 ;其 次 ,针对 基因 隐私 问 
题 的 各 种 计算 策略 ,可 以 采取 一 个 切割 格式 化 数据 集 
的 方式 ,使 得 部 分 共享 同时 确保 个 人 基因 隐私 ;再 者 ， 
相 比 大 公司 和 基因 组 研究 中 心 ,小 型 实验 室 直接 面 对 
个 人 隐私 和 数据 安全 ,采用 云 计算 可 能 对 下 载 和 计算 
大 型 数据 集 等 进行 更 多 控制 。 然 而 ,关键 问题 在 于 
对 数据 管理 存在 法 律 问题 和 技术 方法 ,例如 “知情 同意 
程序 ”的 争议 是 当前 保护 隐私 的 措施 在 未 来 科技 中 可 
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能 失效 ,或 者 安全 的 云 计 算 环 境 的 标准 规范 是 否 在 未 
来 依然 有 效 等 问题 。 

在 以 数据 为 中 心 的 “大 生物 学 "学 科 , 目 前 面临 的 
三 大 挑战 是 :全 面 的 数据 标准 、 发 励 个 别 科学 家 共享 数 
据 、 适 当 的 基础 设施 和 支持 。 因 为 关联 开放 数据 的 存 
在 ,所 以 克服 技术 的 问题 不 大 ,但 是 对 生命 科学 的 异 构 
数据 的 文化 缺乏 了 解 ,使 得 单纯 想 以 技术 解决 问题 的 
作法 ,受到 学 科 传 统 和 现实 环境 的 诸多 无 形 障碍 和 干 
扰 ” 。 为 了 使 研究 数据 得 到 充分 利用 ,生物 科学 社 群 
开始 倡议 技术 和 燃 励 机 制 以 支持 互 操作 性 ,促进 开放 
科学 与 文化 的 增长 等 。 这 些 案例 说 明 公共 共享 数 
据 的 框架 描述 , 既 要 满足 学 科 专 业 知 识 和 科研 人 员 的 
需求 ,又 要 熟悉 掌握 开放 数据 管理 机 制 的 技术 和 科 抠 
信息 政策 。 


5 开放 数据 管理 的 预科 学 基础 


强大 的 元 数据 方法 和 标准 化 发 展 可 以 提高 数据 的 
访问 ,但 并 不 足够 应 付 当 前 开放 数据 生态 (地 理 、 生 命 、 
社会 科学 数据 集 的 合成 规律 ) 的 发 散 性 和 异 质 性 ， 
需要 一 套 良 好 的 规划 来 解决 诸如 可 执行 的 工作 流程 、 
数据 重 现 性 、 所 捕获 的 数据 源 、 数 据 保存 和 复原 、 使 用 
的 归属 和 确认 等 一 系列 问题 。 
数据 密集 型 的 科学 有 处 理 庞 大 数据 量 的 挑战 , 然 
而 同样 艰巨 的 挑战 是 路 学 科 数 据 的 多 样 性 ,特别 是 研 
究 数据 ,还 需要 数据 集 彼此 的 相互 联系 来 理解 复杂 的 
系统 性 问题 (如 环境 变化 及 其 影响 ) 。 研 究 数据 管理 
方法 是 面向 复杂 的 跨 学 科 问 题 的 解决 方式 。 虽 然 技术 
是 处 理 数据 密集 型 科学 跨 学 科 维度 的 关键 因素 ,然而 
与 过 去 那些 分 布 式 异 构 数 据 的 不 同 之 处 在 于 , 它 需 要 
更 简单 .更 灵活 、 更 有 效 的 技术 ,更 重要 的 是 ,有 一 个 技 
术 和 文化 适应 的 需求 ” 。 所 以 ,积极 发 展 战略 性 的 科 
技 数据 管理 的 全 谱 段 生态 链 有 其 必要 性 。 

在 面 对 开 放 的 ,关联 的 、 实 用 的 、 安 全 的 数据 集合 
时 ,图 书馆 学 对 信息 组 织 的 原则 和 方法 是 面 对 众 多 学 
科 的 异同 舱 入 科研 实际 工作 细节 中 ,是 累积 成 功 经 验 
最 多 和 汲取 失败 教训 最 多 的 学 科 。 这 使 我 们 有 信心 但 
也 谨慎 地 提出 一 些 短期 阶段 性 强化 服务 战术 和 长 期 可 
持续 性 发 展 战略 ,以 促进 整体 科学 数据 生态 系统 的 健 
康 化 以 及 和 谐 社 会 经 济 技术 的 演进 。 

(致谢 :感谢 评委 的 评审 和 编辑 部 的 校勘 。) 
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